- Любовные романы
- Фантастика и фэнтези
- Ненаучная фантастика
- Ироническое фэнтези
- Научная Фантастика
- Фэнтези
- Ужасы и Мистика
- Боевая фантастика
- Альтернативная история
- Космическая фантастика
- Попаданцы
- Юмористическая фантастика
- Героическая фантастика
- Детективная фантастика
- Социально-психологическая
- Боевое фэнтези
- Русское фэнтези
- Киберпанк
- Романтическая фантастика
- Городская фантастика
- Технофэнтези
- Мистика
- Разная фантастика
- Иностранное фэнтези
- Историческое фэнтези
- LitRPG
- Эпическая фантастика
- Зарубежная фантастика
- Городское фентези
- Космоопера
- Разное фэнтези
- Книги магов
- Любовное фэнтези
- Постапокалипсис
- Бизнес
- Историческая фантастика
- Социально-философская фантастика
- Сказочная фантастика
- Стимпанк
- Романтическое фэнтези
- Ироническая фантастика
- Детективы и Триллеры
- Проза
- Юмор
- Феерия
- Новелла
- Русская классическая проза
- Современная проза
- Повести
- Контркультура
- Русская современная проза
- Историческая проза
- Проза
- Классическая проза
- Советская классическая проза
- О войне
- Зарубежная современная проза
- Рассказы
- Зарубежная классика
- Очерки
- Антисоветская литература
- Магический реализм
- Разное
- Сентиментальная проза
- Афоризмы
- Эссе
- Эпистолярная проза
- Семейный роман/Семейная сага
- Поэзия, Драматургия
- Приключения
- Детская литература
- Загадки
- Книга-игра
- Детская проза
- Детские приключения
- Сказка
- Прочая детская литература
- Детская фантастика
- Детские стихи
- Детская образовательная литература
- Детские остросюжетные
- Учебная литература
- Зарубежные детские книги
- Детский фольклор
- Буквари
- Книги для подростков
- Школьные учебники
- Внеклассное чтение
- Книги для дошкольников
- Детская познавательная и развивающая литература
- Детские детективы
- Домоводство, Дом и семья
- Юмор
- Документальные книги
- Бизнес
- Работа с клиентами
- Тайм-менеджмент
- Кадровый менеджмент
- Экономика
- Менеджмент и кадры
- Управление, подбор персонала
- О бизнесе популярно
- Интернет-бизнес
- Личные финансы
- Делопроизводство, офис
- Маркетинг, PR, реклама
- Поиск работы
- Бизнес
- Банковское дело
- Малый бизнес
- Ценные бумаги и инвестиции
- Краткое содержание
- Бухучет и аудит
- Ораторское искусство / риторика
- Корпоративная культура, бизнес
- Финансы
- Государственное и муниципальное управление
- Менеджмент
- Зарубежная деловая литература
- Продажи
- Переговоры
- Личная эффективность
- Торговля
- Научные и научно-популярные книги
- Биофизика
- География
- Экология
- Биохимия
- Рефераты
- Культурология
- Техническая литература
- История
- Психология
- Медицина
- Прочая научная литература
- Юриспруденция
- Биология
- Политика
- Литературоведение
- Религиоведение
- Научпоп
- Психология, личное
- Математика
- Психотерапия
- Социология
- Воспитание детей, педагогика
- Языкознание
- Беременность, ожидание детей
- Транспорт, военная техника
- Детская психология
- Науки: разное
- Педагогика
- Зарубежная психология
- Иностранные языки
- Филология
- Радиотехника
- Деловая литература
- Физика
- Альтернативная медицина
- Химия
- Государство и право
- Обществознание
- Образовательная литература
- Учебники
- Зоология
- Архитектура
- Науки о космосе
- Ботаника
- Астрология
- Ветеринария
- История Европы
- География
- Зарубежная публицистика
- О животных
- Шпаргалки
- Разная литература
- Зарубежная литература о культуре и искусстве
- Пословицы, поговорки
- Боевые искусства
- Прочее
- Периодические издания
- Фанфик
- Военное
- Цитаты из афоризмов
- Гиды, путеводители
- Литература 19 века
- Зарубежная образовательная литература
- Военная история
- Кино
- Современная литература
- Военная техника, оружие
- Культура и искусство
- Музыка, музыканты
- Газеты и журналы
- Современная зарубежная литература
- Визуальные искусства
- Отраслевые издания
- Шахматы
- Недвижимость
- Великолепные истории
- Музыка, танцы
- Авто и ПДД
- Изобразительное искусство, фотография
- Истории из жизни
- Готические новеллы
- Начинающие авторы
- Спецслужбы
- Подростковая литература
- Зарубежная прикладная литература
- Религия и духовность
- Старинная литература
- Справочная литература
- Компьютеры и Интернет
- Блог
Расшифрованная жизнь. Мой геном, моя жизнь - Крейг Вентер
Шрифт:
Интервал:
Закладка:
Но поскольку каждый конец последовательности секвенировался отдельно, для обеспечения четкой работы этого метода сборки нужно было вести тщательный учет – для абсолютной уверенности, что мы смогли правильно соединить все пары концевых последовательностей: ведь если хотя бы одна из ста попыток приведет к ошибке и не найдется соответствующая пара для последовательности, все пойдет насмарку и метод не сработает. Один из способов избежать этого – использование штрих-кода и датчиков для отслеживания каждого этапа процесса. Но в начале работы у лаборантов не было необходимого программного обеспечения и оборудования для секвенирования, поэтому приходилось делать все вручную. В Celera небольшая команда, менее двадцати человек, каждый день обрабатывала рекордное количество клонов – 200 тысяч. Мы могли предвидеть некоторые ошибки, например неправильное прочтение данных из 384 лунок, а затем использовать компьютер для нахождения явно ошибочной операции и исправить положение. Конечно, еще оставались отдельные недочеты, но это только подтверждало мастерство команды и уверенность, что мы можем устранять ошибки.
Несмотря на все сложности, мы сумели за четыре месяца прочесть 3156 миллионов последовательностей, всего около 1,76 миллиарда нуклеотидных пар, содержащихся между концами 1,51 миллиона клонов ДНК. Теперь настала очередь Джина Майерса, его команды и нашего компьютера – нужно было сложить все участки вместе в хромосомы дрозофилы. Чем длиннее становились участки, тем менее точным оказывалось секвенирование. В случае дрозофилы последовательности насчитывали в среднем 551 нуклеотидную пару, и средняя точность была 99,5 %. Если иметь 500-буквенные последовательности, почти любой может определить места совпадений, передвигая одну последовательность вдоль другой до тех пор, пока не обнаружатся совпадения.
Для секвенирования Haemophilus influenzae у нас было 26 тысяч последовательностей. Для сравнения каждой из них со всеми остальными потребовалось бы проделать 26 тысяч сравнений в квадрате, или 676 миллионов. Геном дрозофилы, с его 3,156 миллиона прочтений потребовал бы около 9,9 триллиона сравнений. В случае человека и мыши, где мы произвели 26 миллионов прочтений последовательности, требовалось около 680 триллионов сравнения. Поэтому не вызывает удивления, что большинство ученых весьма скептически относились к возможному успеху этого метода.
Хотя Майерс и обещал все наладить, у него постоянно возникали сомнения. Теперь он работал дни и ночи напролет, выглядел измученным и как-то посерел. К тому же у него были проблемы в семье, и он стал большую часть свободного времени проводить с журналистом Джеймсом Шривом, который писал о нашем проекте и как тень следил за ходом исследований. Пытаясь как-то отвлечь Джина, я взял его с собой на Карибы – расслабиться и походить под парусом на моей яхте. Но и там он часами сидел, скрючившись над ноутбуком, нахмурив черные брови и щуря свои черные глаза от яркого солнца. И, несмотря на невероятные трудности, Джин и его команда сумели за полгода сгенерировать более полумиллиона строк компьютерного кода для нового ассемблера.
Если бы результаты секвенирования были стопроцентно точными, без повторяющихся ДНК, сборка генома была бы относительно несложной задачей. Но в реальности геномы содержат большое количество повторяющихся ДНК разного типа, разной длины и частоты. С короткими повторами, состоящими из менее пяти сотен пар нуклеотидов, справиться относительно легко, с более длинными повторами – сложнее. Для решения этой проблемы мы использовали метод «нахождения пары», то есть секвенировали оба конца каждого клона и получали клоны разной длины для обеспечения максимального количества совпадений.
Алгоритмы, закодированные в полумиллионе строк компьютерного кода команды Джина, предполагали поэтапный сценарий – от самых «безвредных» действий, например простого перекрывания двух последовательностей, до более сложных, например использования обнаруженных пар для слияния островков перекрывшихся последовательностей. Это было похоже на сложение головоломки, когда небольшие островки собранных участков составляются вместе и образуют бо́льшие острова, а затем весь процесс повторяется снова. Только вот в нашей головоломке было 27 миллионов фрагментов. И было очень важно, чтобы участки брались из последовательности высокого качества сборки: представьте себе, что будет, если вы собираете пазл, а цвета или изображения его элементов нечеткие и размытые. Для дальнего порядка последовательности генома значительная доля прочтений должна быть в виде совпадающих пар. Учитывая, что результаты все еще отслеживались вручную, мы с облегчением обнаружили, что 70 % имевшихся у нас последовательностей именно такие. Специалисты по компьютерному моделированию объяснили, что при меньшем проценте собрать нашего «шалтая-болтая» было бы невозможно.
И теперь мы смогли использовать ассемблер Celera для секвенирования последовательности: на первом этапе результаты корректировались для достижения самой высокой точности; на втором этапе программа Screener удаляла загрязняющие последовательности из ДНК плазмиды или E. coli. Процесс сборки может быть нарушен всего-навсего какими-то 10 парами оснований «чужой» последовательности. На третьем этапе программа Screener проверяла каждый фрагмент на соответствие известным повторяющимся последовательностям в геноме плодовой мушки – данным Джерри Рубина, который их «любезно» нам предоставил. Местоположение повторов с частично перекрывающимися участками записывалось. На четвертом этапе другая программа (Overlapper) обнаруживала перекрывающиеся участки, сравнивая каждый фрагмент со всеми остальными, – колоссальный эксперимент по обработке огромного объема числовых данных. Ежесекундно мы сравнивали 32 миллиона фрагментов с целью обнаружить по крайней мере 40 перекрывающихся пар оснований с менее 6 % различий. При обнаружении двух перекрывающихся участков мы объединяли их в больший фрагмент, так называемый «контиг» – набор перекрывающихся фрагментов.
В идеальном случае этого бы вполне хватило для сборки генома. Но нам приходилось бороться со статтерами и повторами в коде ДНК, а это означало, что один фрагмент ДНК может перекрываться с несколькими различными участками, создавая ложные соединения. Чтобы упростить задачу, мы оставляли только однозначно соединенные фрагменты, так называемые «унитиги». Программа, с помощью которой мы выполняли эту операцию (Unitigger), по существу удаляла всю последовательность ДНК, которую мы не могли с уверенностью определить, оставляя лишь эти унитиги. Этот шаг не только дал нам возможность рассмотреть другие варианты сборки фрагментов, но и существенно упростил задачу. После редукции количество перекрывающихся фрагментов сократилось с 212 миллионов до 3,1 миллиона, и проблема упростилась в 68 раз. Детали головоломки постепенно, но неуклонно вставали на свои места.
А затем мы могли использовать информацию о способе спаривания последовательностей одного и того же клона, используя «каркасный» алгоритм. Все возможные унитиги со взаимно перекрывающимися парами оснований объединялись в специальные каркасы. Для описания этого этапа в своих лекциях я провожу аналогию с детским игрушечным конструктором Tinkertoys. Он состоит из палочек разной длины, которые можно вставлять в отверстия, расположенные на деревянных узловых деталях (шариках и дисках), и составить так объемную конструкцию. В нашем случае узловые детали – это унитиги. Зная, что парные последовательности располагаются на концах клонов длиной в 2 тысячи, 10 тысяч или 50 тысяч пар оснований – то есть как бы находятся на расстоянии определенного количества отверстий друг от друга, – их можно выстроить в одну линию.
В результате тестирования этой методики на последовательности Джерри Рубина, составлявшей примерно одну пятую генома плодовой мушки, мы получили всего лишь 500 пробелов. Проведя в августе испытания на наших собственных данных, мы получили в результате более 800 тысяч небольших фрагментов. Существенно большее количество данных для обработки показало, что методика работала плохо – результат оказался противоположным ожидаемому. В течение нескольких следующих дней паника нарастала, а список возможных ошибок удлинялся. С верхнего этажа корпуса № 2 адреналиновый раж просачивался в комнату, шутливо называемую «Безмятежными покоями». Однако никакого покоя и безмятежности там не ощущалось, особенно в течение по крайней мере пары недель, когда сотрудники буквально кругами слонялись в поисках выхода из создавшегося положения.

